174 research outputs found

    Graphic Symbol Recognition using Graph Based Signature and Bayesian Network Classifier

    Full text link
    We present a new approach for recognition of complex graphic symbols in technical documents. Graphic symbol recognition is a well known challenge in the field of document image analysis and is at heart of most graphic recognition systems. Our method uses structural approach for symbol representation and statistical classifier for symbol recognition. In our system we represent symbols by their graph based signatures: a graphic symbol is vectorized and is converted to an attributed relational graph, which is used for computing a feature vector for the symbol. This signature corresponds to geometry and topology of the symbol. We learn a Bayesian network to encode joint probability distribution of symbol signatures and use it in a supervised learning scenario for graphic symbol recognition. We have evaluated our method on synthetically deformed and degraded images of pre-segmented 2D architectural and electronic symbols from GREC databases and have obtained encouraging recognition rates.Comment: 5 pages, 8 figures, Tenth International Conference on Document Analysis and Recognition (ICDAR), IEEE Computer Society, 2009, volume 10, 1325-132

    Analyse de classes de formes pour la transcription de textes imprimés anciens

    Get PDF
    International audienceCe travail se situe dans le contexte de la numérisation et de l'indexation de documents imprimés anciens. Il décrit un logiciel intitulé Retro, permettant de transcrire semi automatiquement les zones de texte préalablement localisées et extraites à l'aide d'un autre logiciel nommé Agora. Agora réalise simultanément l'analyse de structure des pages et une extraction de toutes les composantes connexes présentes dans chaque page. Une classification non-supervisée de ces composantes connexes est effectuée et conduit à la création de classes regroupant des composantes semblables. Nous proposons dans cet article une étude, puis une exploitation des classes issues d'Agora pour obtenir une transcription du texte (OCR). Nous présentons une analyse statistique et qualitative des classes produites, avant de proposer une méthode de fusion des classes basées sur l'étude de leur relation de voisinage qui nous permet d'étiqueter rapidement 60% des caractères d'un ouvrage sans utiliser de méthode couteuse en temps de calcul

    A structural representation for understanding line-drawing images

    Get PDF
    International audienceIn this paper, we are concerned with the problem of finding a good and homogeneous representation to encode line-drawing documents (which may be handwritten). We propose a method in which the problems induced by a first-step skeletonization have been avoided. First, we vectorize the image, to get a fine description of the drawing, using only vectors and quadrilateral primitives. A structural graph is built with the primitives extracted from the initial line-drawing image. The objective is to manage attributes relative to elementary objects so as to provide a description of the spatial relationships (inclusion, junction, intersection, etc.) that exist between the graphics in the images. This is done with a representation that provides a global vision of the drawings. The capacity of the representation to evolve and to carry highly semantic information is also highlighted. Finally, we show how an architecture using this structural representation and a mechanism of perceptive cycles can lead to a high-quality interpretation of line drawings

    De l'appariement de graphes symboliques à l'appariement de graphes numériques : Application à la reconnaissance de symboles

    Get PDF
    Les représentations sous forme de graphes structurels ont été appliquées dans un grand nombre de problèmes en vision par ordinateur et en reconnaissance de formes. Néanmoins, lors de l'étape d'appariement de graphes, les algorithmes classiques d'isomorphisme de graphes sont peu performants quand l'image est dégradée par du bruit ou des distorsions vectorielles. Cet article traite de la reconnaissance de symboles graphiques grâce à la formulation d'une nouvelle mesure de similarité entre leur représentation sous forme de graphes étiquetés. Dans l'approche proposée, les symboles sont d'abord décomposés en primitives structurelles et un graphe attribué est alors généré pour décrire chaque symbole. Les nœuds du graphe représentent les primitives structurelles tandis que les arcs décrivent les relations topologiques entre les primitives. L'utilisation d'attributs numériques pour caractériser les primitives et leurs relations permet d'allier précision et, invariance à la rotation et au changement d'échelle. Nous proposons également une nouvelle technique d'appariement de graphes basée sur notre fonction de similarité qui utilise les valeurs numériques des attributs pour produire un score de similarité. Cette mesure de similarité a de nombreuses propriétés intéressantes comme un fort pouvoir de discrimination, une invariance aux transformations affines et une faible sensibilité au bruit

    User-driven Page Layout Analysis of historical printed Books

    Get PDF
    International audienceIn this paper, based on the study of the specificity of historical printed books, we first explain the main error sources in classical methods used for page layout analysis. We show that each method (bottom-up and top-down) provides different types of useful information that should not be ignored, if we want to obtain both a generic method and good segmentation results. Next, we propose to use a hybrid segmentation algorithm that builds two maps: a shape map that focuses on connected components and a background map, which provides information about white areas corresponding to block separations in the page. Using this first segmentation, a classification of the extracted blocks can be achieved according to scenarios produced by the user. These scenarios are defined very simply during an interactive stage. The user is able to make processing sequences adapted to the different kinds of images he is likely to meet and according to the user needs. The proposed “user-driven approach” is capable of doing segmentation and labelling of the required user high level concepts efficiently and has achieved above 93% accurate results over different data sets tested. User feedbacks and experimental results demonstrate the effectiveness and usability of our framework mainly because the extraction rules can be defined without difficulty and parameters are not sensitive to page layout variation

    Analyse d'Images de Documents Anciens: une Approche Texture

    Get PDF
    In this article, we propose a method of characterization of images of old documents based on a texture approach. This characterization is carried out with the help of a multi-resolution study of the textures contained in the images of the document. Thus, by extracting five features linked to the frequencies and to the orientations in the different areas of a page, it is possible to extract and compare elements of high semantic level without expressing any hypothesis about the physical or logical structure of the analysed documents. Experimentations demonstrate the performance of our propositions and the advances that they represent in terms of characterization of content of a deeply heterogeneous corpus.Dans cet article, nous proposons une méthode de caractérisation d'images d'ouvrages anciens basée sur une approche texture. Cette caractérisation est réalisée à l'aide d'une étude multirésolution des textures contenues dans les images de documents. Ainsi, en extrayant cinq indices liés aux fréquences et aux orientations dans les différentes parties d'une page, il est possible d'extraire et de comparer des éléments de haut niveau sémantique sans émettre d'hypothèses sur la structure physique ou logique des documents analysés. Des expérimentations montrent la faisabilité de la réalisation d'outils d'aide à la navigation ou d'aide à l'indexation. Au travers de ces expérimentations, nous mettrons en avant la pertinence de ces indices et les avancées qu'ils représentent en terme de caractérisation de contenu d'un corpus fortement hétérogène

    Analyse d'images de documents anciens : Catégorisation de contenus par approche texture

    Get PDF
    Nous proposons une caractérisation du contenu des ouvrages anciens basée sur une approche texture non paramétrique. Cette démarche se veut générique et adaptable à tout type d'ouvrages en s'appuyant sur l'homogénéité des textures que l'on retrouve dans un ouvrage. En appliquant à plusieurs résolutions 5 algorithmes d'extractions de textures il est possible de caractériser le contenu des pages d'un ouvrage. Cette méthode est appliquée sur des pages d'ouvrages anciens du 16ème siècle

    An Exact Graph Edit Distance Algorithm for Solving Pattern Recognition Problems

    Get PDF
    International audienceGraph edit distance is an error tolerant matching technique emerged as a powerful and flexible graph matching paradigm that can be used to address different tasks in pattern recognition, machine learning and data mining; it represents the minimum-cost sequence of basic edit operations to transform one graph into another by means of insertion, deletion and substitution of vertices and/or edges. A widely used method for exact graph edit distance computation is based on the A* algorithm. To overcome its high memory load while traversing the search tree for storing pending solutions to be explored, we propose a depth-first graph edit distance algorithm which requires less memory and searching time. An evaluation of all possible solutions is performed without explicitly enumerating them all. Candidates are discarded using an upper and lower bounds strategy. A solid experimental study is proposed; experiments on a publicly available database empirically demonstrated that our approach is better than the A* graph edit distance computation in terms of speed, accuracy and classification rate

    Multi One-Class Incremental SVM for Document Stream Digitization

    Get PDF
    International audienceInside the DIGIDOC project (ANR-10-CORD-0020)-CONTenus et INTeractions (CONTINT), our approach was applied to several scenarios of classification of image streams which can cores ond to real cases in digitization projects. Most of the time, the processing of documents is considered as a well-defined task: the classes (also called concepts) are defined and known before the processing starts. But in real industrial workflows of document processes, it may frequently happen that the concepts can change during the time. In a context of document stream processing, the information and content included in the digitized pages can evolve over the time as well as the judgment of the user on what he wants to do with the resulting classification. The goal of this application is to create a module of learning, for a steam-based document images classification (especially dedicated to a digitization process with a huge volume of data), that adapts different situations for intelligent scanning tasks: adding, extending, contracting, splitting, or merging the classes in on an online mode of streaming data processing

    Une nouvelle méthode de classification monoclasse à base de représentation symbolique : Application à la classification de documents

    Get PDF
    National audienceConstruire un classificateur obtenant de bons résultats tout en utilisant un faible nombre d'exemples d'apprentissage est un besoin récurrent dans le domaine de la classification d'images de documents, et en particulier pour l'entreprise pour laquelle cette étude a été réalisée. Dans ce cas-là, le choix d'utiliser un classificateur monoclasse (nécessitant uniquement des exemples positifs) représente une alternative intéressante. Dans cet article, nous présentons une nouvelle méthode de classification monoclasse basée sur une représentation symbolique. Initialement, un ensemble de caractéristiques est extrait à partir des données de l'ensemble d'apprentissage. Puis, un vecteur d'intervalles issus de ces caractéristiques est construit pour représenter la classe. Chaque intervalle (donnée symbolique) est calculé à partir de la moyenne et de l'écart-type de chaque caractéristique. Pour évaluer le classificateur monoclasse proposé, nous avons utilisé un ensemble de données composé de 544 images de documents. Les expérimentations montrent que le classificateur monoclasse est performant lorsque le nombre d'exemples d'apprentissage est faible (=10). Il est donc utilisable dans un contexte de classification de documents, avec de meilleurs résultats que ceux obtenus par un classificateur k-ppv
    corecore